yzqzss|一座桥在水上's log
草,刚看了 hd-idle 的日志,发现自 5 月 4 号后,我没一块硬盘停转过…… 都是 scrutiny 惹的锅,它读 smartctl 会使硬盘唤醒…… 我实测先手动停转,然后跑 scrutiny,然后硬盘一个接一个地起飞了…… GitHub issue 上看到有些人用 scrutiny ,但是没影响到硬盘休眠。(然后甚至让 scrutiny 出了 BUG https://github.com/AnalogJ/scrutiny/issues/157 ) 但是至少在我这儿,确实 scrutiny…
我艹,Docker,Scrutiny!
scrutiny 这东西虽然内部确实是用 Serial ID 来识别硬盘的,但是,如果 /dev/sdX 命名发生变化(A->B),docker 会自行把你通过 --devices 传入的 /dev/sdX 映射回以前的命名(B->A)。(或者说,可能 docker 容器创建时就固化了 Serial ID -> named device 这个映射)具体啥原因还没细看。
我看到有块盘炸了,然后我在 host 用 sdX 找到了那块盘,然后我把那块盘拔下来了。然后我发现我拔错了……
scrutiny 这东西虽然内部确实是用 Serial ID 来识别硬盘的,但是,如果 /dev/sdX 命名发生变化(A->B),docker 会自行把你通过 --devices 传入的 /dev/sdX 映射回以前的命名(B->A)。(或者说,可能 docker 容器创建时就固化了 Serial ID -> named device 这个映射)具体啥原因还没细看。
我看到有块盘炸了,然后我在 host 用 sdX 找到了那块盘,然后我把那块盘拔下来了。然后我发现我拔错了……
我艹,傻逼 HGST,今天才发现有部分硬盘 FW 需要离线才能生效 hdparm -S <int>(无读写多久后休眠)。
我以为我给硬盘设置了 2 小时无读写休眠,其实根本就没有生效,这几个月服务器一直没关机,好几个硬盘还在跑我以前设置的10分钟(甚至更短?)就休眠的设置。
于是这些硬盘这几个月被干了 +10000 的 0xC0 Power-off Retract Count 。
我以为我给硬盘设置了 2 小时无读写休眠,其实根本就没有生效,这几个月服务器一直没关机,好几个硬盘还在跑我以前设置的10分钟(甚至更短?)就休眠的设置。
于是这些硬盘这几个月被干了 +10000 的 0xC0 Power-off Retract Count 。
快乐的时光总是短暂,过去一个月面基了 16 位朋友,见过面的、网上认识很久的、眼熟的、不认识的。
谢谢大家出来和桥玩!
谢谢大家出来和桥玩!
❤9🥰8